拨开迷雾选型数据中台,兼谈这些供应商的商业模式
“中台”本身是个架构概念以及数字化产品构建方法,无论是“业务中台”、“数据中台”还是“技术中台”,都没有权威标准或行业共同认可的定义。开发了一个软件系统的人,指着自己开发的东西说,这个叫“中台”,他就定义了什么叫中台。
然而,当“中台”被指为一种产品或服务被商业化后,就在市场上给各个企业IT买方带来很多困惑。关于“中台”和“数据中台”的概念辨析,我在过去几年写过很多文章,在此不再赘述。这个名词出现5年来,目前在市场上还有生命力的是“数据中台”,现实情况是,实际购买“数据中台”的企业普遍用户满意度低,不少业内专业人士对这个名词嗤之以鼻。
某华东大型民营企业CIO跟我说,他们公司老板为了赶上数字化转型的快车,跟国内某头部云计算大厂签署了价值千万级的数据中台项目,使用了该云计算公司的数据仓库和数据分析的软件工具,厂商找了一家外包公司来做开发,搞了一年多,最后结果就是替换了过去用了快十年的国际大厂品牌的数据仓库和BI软件,出报表的速度确实快了30~50%,但是业务并没有发生变化。
我说你们原来那个数仓按照我的经验,就算是找一线实施公司来做,软件加实施也就是几百万而已,现在花了三、四倍的价钱,划算吗?CIO说,这事儿就是厂商“玩概念、忽悠老板”,项目中的业务分析都是自己IT部门干的,那家云大厂及其合作伙伴没有任何业务梳理的能力,更不用说搞业务优化的方案、帮助企业提升运营能力了。
总之,那个数据中台项目没让企业收获任何业务价值,而在这个项目中只是担任外包开发任务的某厂商,却赫然以数据中台的平台供应商身份出现在市场上。
我的业界同行们就更是直言不讳了,某既在一线IT咨询公司做过顾问,又在企业里做过CIO的朋友,在评论我征求大家意见怎么看“数据中台”时说:
具有技术背景,活跃的IT界意见领袖阿朱曾说:
所以,企业如何选择到一家合适的“数据中台”供应商来避坑呢,且听我道来。
(一)指导思想
为了要上好“数据中台”,我们与其给“数据中台”的具体技术和功能范围下一个准确的定义,还不如先想明白两个问题:
第一、形而上的问题:数据中台究竟给企业解决了什么具体问题?带来了什么业务价值?
第二、面向落地的问题:如果“数据中台”是一个具体IT系统的话,这个系统的用户究竟是谁?这些用户对“数据中台”的需求和期望是什么?
对于第一个问题,无论花里胡哨的“数字化转型”理念怎么吹,企业老板对“数据中台”的需求的确是客观存在——企业的业务越来越线上化处理,无论是面向内部流程的管理信息系统、核心运营系统,还是面向外部交互的互联网平台、面向设备交互的物联网平台,都产生了很多数据,然而这些数据都被锁在各个内部和外部的信息系统中,没法集成整合起来,从而无法对数据进行加工、分析,服务于业务。
数据中台的价值还可以从企业资产在组织内划分、归属的角度去看。今天,数据越来越成为企业的要素或者资产——企业IT部门并不先天拥有数据,另一方面,数据是从业务部门来,又被业务部门用,然而业务部门传统上并没有技术能力来管理和处理数据——如果考虑到组织内部对资产控制权争夺,怎样获得数据控制权,在组织内部躺赢,这个动机充满着企业政治意味。这也能解释为何当前非技术出身而充满企业政治智慧的领导去管理IT部门时,总喜欢抢占数据中台的高地了。
“数据中台”就是解决企业这些需求的,当我们不去深究那些啥结构化/非结构化,提取/加工/存储,离线/在线,批处理/流处理,存算分离,数据仓库/数据湖,数据网格,集中式/分布式,标签/ID,分析引擎/数据集市/API等等技术名词,“数据中台”在企业内发挥业务价值可分为三个阶段:
如本文开头所讲的案例,那家企业的数据中台应用也就是“分析洞察”的第一阶段水平,实际上这是绝大多数中国企业目前的“数据中台”现状,和过去的“数据仓库+商业智能”并无本质区别 ,只是由于近年来分布式计算、大数据技术的发展,同时各个开源运动使得技术革新越来越开放化,数据中台相关的基础技术更容易获取,技术迭代得以加快,数据中台技术已经更新换代了。
企业要实现数据中台的第二、第三阶段,很大程度上都不是技术问题,因而,企业数字化转型的自身数字化运营能力(例如数据治理、敏捷组织的能力)和数字化业务愿景,决定了“数据中台”的选型策略。
对第二个问题,“数据中台”究竟是谁用的系统?既然叫“中台”,那就不是面向数据最终消费者——亦即业务用户的“前台”。我认为数据中台的用户是如下五类角色,数据中台为这些用户提供数据的提取、加工、管理、运营的技术平台、开发底座和工具集:
1,信息管家(Information Stewards):负责数据治理体系,数据质量管理,数据的业务规则制定,数据安全和权限管理等;
2,数据架构师和工程师(Data architect,Data Engineer):建立从数据源到数据应用的提取、处理、可运营化的管道,开发、集成有关技术工具,保证系统响应速度和数据可信性;
3,数据科学家(Data Scientist):面向业务需要对原始数据或者加工过的数据开展洞察,进行代码级的算法开发和业务建模;
4,数据分析师(Data analytst):利用已经整理好的“数据库存”,利用无代码和低代码工具进行数据探索和数据分析,提供业务报表、洞察和优化方案;
5,数据资产高管(Data Asset Officer):管理企业数据资产,评估价值,确定企业内外的数据交换、利用的价值变现模式
数据中台的选型标准必须来自于这些用户的具体需求。显然,“数据中台”并不完全是一个CRM、ERP这类管理应用软件,除了数据管理自身的业务职能(例如数据资产目录、数据质量管理、数据运营等)算是管理应用软件之外,它本身并不包含太多的业务功能,更多是技术平台和工具,是给进行代码级开发的工程师、科学家用的,或者采用目前流行的“低代码”方式来开发。
从选型的角度来看,业务应用类系统的选型着眼点在用户体验友好、功能强大全面、易于配置、包含最佳业务实践等,这是对数据中台的数据管理、数据运营工具的要求;而对于技术平台和开发底座,则需要符合技术人员的技术偏好及习惯,上手快,工具多,性能好,存在广泛活跃的技术社区便于交流——我认为好的技术中台产品供应商必须是技术开源社区(例如Github)的活跃贡献者,以及技术大厂开源项目和Apache等开源组织的积极参与者,没有社会技术人员积极参与、没有受到“全球最大同性交友网站”的网友们追捧的技术工具,是没有生命力的。
👇是广告
👆广告结束
本广告收入将捐赠公益事业
(二)实施路线
企业上“数据中台”并不是开发一个IT系统,而是建立新的数字化平台和工作方式。数据中台的实施过程不应该是下图这样的传统信息系统实施的串行模式:
正确的数据中台建设方法是总体规划、敏捷迭代的过程:
首先明确数据中台的愿景和战略,规划数据中台的架构,建立产品管理和敏捷开发的机制,选择好一系列技术平台、管理工具和开发底座,其次才是运用敏捷方法,在数据中台上开发数字化产品,包括了用例设计、产品开发以及业务运营的迭代循环,用数据产品支持业务运营,测试业务效果,反馈迭代(参见《被低估了的数字化方法论 | IBM车库方法》《从采购流程数字化案例谈人性化设计和数字化产品的方法》)
下图是咨询公司BCG的数字化架构和产品团队Platinion,在中国为一家零售企业打造数据中台的案例,数字化产品开发和组织赋能两条腿走路,抓好九个方面:
(三)选型原则
基于上述数据中台建设的指导思想以及实施路线,市场上给企业提供数据中台相关产品和服务其实有三种类型,构成了七类供应商。三种产品和服务分别是:
一、咨询/规划:在企业高层领导、业务人员和技术人员之间沟通,话术上同时掌握了管理装逼语言、业务运营语言和IT技术语言,取得多方共识,推进组织前行,这就是咨询的价值。
二、平台/工具:数据中台涉及到一系列技术平台、管理工具和开发工具,从功能范畴上来说,包括了数据提取和注入、数据加工、数据存储、数据计算、数据标准化、数据服务、数据治理、Devops(开发运维管理)等领域,从交付形式上来说有几类:一是公有云服务,主要是微软Azure、亚马逊AWS、IBM云、阿里云、百度智能云等大厂,二是基于云厂商技术的企业私有云,三是独立软件供应商提供的、可部署于公有云和私有云上的软件,这类独立软件厂商又可以分为几类,包括:开源软件发行商(例如最普及的大数据平台Hadoop的发行公司Cloudera)、对开源软件发行版进行二次打包的软件商(很多国内“数据中台”厂商属于这种性质,因各家技术能力参差不齐,市场上鱼龙混杂)、企业软件商或者服务商的相关工具(例如SAP、Salesforce的数据治理工具,用友、金蝶、浪潮的数字化平台上也包括了“数据中台”)以及原创研发的厂商(例如去年在资本市场上大火的云数仓公司Snowflake,或者在数据治理软件领域内独树一帜的Informatica)。
三、开发/运营:这属于传统的IT服务公司的系统集成以及业务流程外包的服务,它执行由上述第一条“咨询/规划”产出的建设路线,运用第二条的平台和工具,面向用户开发可用的数字化产品;除了软件开发和系统集成外,数据中台建设还涉及到大量的数据相关操作,例如数据清理、打标签、A/B测试等,企业往往也交给服务商代劳。我观察到国内不少数据中台建设项目中,企业让服务商干得最多的还不是开发应用,而是为了尽快出成果,干手工去“洗数据”这样的脏活累活。
这三类产品和服务排列组合起来,国内市面上的数据中台供应商实际上有七种类型:
1、纯咨询公司:只做数字化转型规划、业务场景规划、架构设计以及敏捷转型辅导,通常也包括帮助客户开展后期实施阶段的大项目管理(PMO);
2、纯IT服务公司:通常缺乏咨询能力,也不具有产品化的平台和工具,只提供面向企业的架构实施、代码开发和运营外包服务,这类公司往往也作为1或3的外包方;
3、纯产品公司:无论是云服务公司还是独立软件商,核心能力是平台和工具的研发,产品化程度高,由于自身只专注于产品盈利,将面向企业的咨询以及系统集成的服务交给合作伙伴去交付;
4、 咨询+IT服务公司:在IT服务产业链里,“高端咨询公司往下走”和“传统系统集成商往上走”并存,少数国际大牌IT服务公司属于这种类型;
5、咨询+产品公司:由于咨询服务强调供应商中立,所以几乎没有咨询公司做软件产品;而产品公司和咨询公司本身商业模式差别很大,虽然有些产品公司也有类似于咨询的总体规划服务,但是产品公司一般也不靠咨询挣钱,这种咨询更多是销售自家产品的售前宣传;
6、产品+服务公司:不少国内的“数据中台”公司属于这种类型,虽然宣称自己有数据中台产品,但是实际上产品化程度不高,实质上还是做项目、做开发外包和运营外包的服务公司。这类公司多源自纯产品公司的外包商或者项目型服务公司,在服务过程中逐步沉淀自己的技术产品或业务解决方案;在风险投资的压力下,可能会更看重业务增长而非沉下心去打磨产品;
7、 “咨询+产品+开发+运营”一条龙服务的公司:在数据中台价值链中,真正的全价值链玩家很少,什么都做并不意味着什么都能做到最好,如果一定要我举个例子,我觉得可能只有百年老店IBM够格了,IBM提供公有云、混合云、容器平台、数据经纬、咨询、IT服务、数据分析、人工智能等想得到的每种数据中台业务。
所以,企业如果要选型数据中台的供应商,要想明白在上述七类供应商中,自己究竟是找哪一类?我个人觉得,当企业还没想明白时,首先还是要找一家态度靠谱的、产品供应商中立的咨询公司帮规划下。
在三方面的选型标准各不相同:
方面 | 关键前提或标准 |
咨询/规划选型 |
|
平台/工具选型 |
|
开发/运营选型 |
|
企业选择咨询商和服务商更多靠的是人际互动,看公司品牌(一般来说,服务公司品牌就是品质的保证),看跟对方负责人是否理念和情趣相投,而相对较为技术化的选型是平台/工具的选择,我建议企业应该把技术栈选型在规划阶段完成,或者在CTO(如果有的话)指导下,交给集成商或者自己IT团队的一线架构师和技术人员去决策,选自己爱用、习惯用的技术。
我个人非常推荐采用公用云,阿里云、百度智能云等都提供了全面的云上数据中台服务,不过中国企业的上云意愿普遍低于国外企业;国内数据中台供应商大多致力于在大数据平台之上开发各种工具。
在国外IT行业里,自行构建数据中台也需要整合各种技术组件或者云服务,下图是《认识数字化转型》(参见:《认识数字化转型》推荐序)一书作者Tom Siebel指出的生态体系,包括了AWS、微软等提供的云服务以及众多的开源软件和软件供应商,Tom本人创业的公司正是希望整合这些所有的技术组件,构建一个模块驱动的数据中台。
从数据源到数据消费的数据处理链路各个环节中,也出现了很多独立软件供应商,下图是Informatica希望整合的“企业级数据准备(enterprise data preparation) ”产品链的国外厂商,这样来看,数据治理厂商Informatica也属于综合性的数据中台供应商了:
国内的数据中台产品供应商们却往往没分这么细,大多是定位为无所不包、啥都能做的“中台”,正是因没有产品聚焦,在国内媒体上经常看见“数据中台50强”一类的排名(例如下图,这还是2019年的图,在易观最近的2021年数据中台行业研究里都已经没放供应商名录了),我觉得这些数据中台厂商大都是IT服务公司,而非产品公司。这是我在《企业级IT软件和服务的商业模式》文中,对中国IT服务商的产品化能力的担忧,也感到整个中国数据中台行业,市场需求旺盛,行业大而不强。
旧文参考:
企业IT规划 | 数据治理该归哪个部门管,数据治理平台有多大用?